本文介绍了与萨特布-Naija的基础努力,这是一种非原生(L2)尼日利亚语言语的新型语料库。我们描述了如何创建和策划的语料库以及令人口气分类和学习尼日利亚口音嵌入的初步实验。语料库的初始版本包括L2英语尼日利亚语言的900多个录音,例如Yoruba,Igbo,Edo,Efik-Ibibio和Igala。我们进一步演示了Wav2VEC的预先训练模型上的微调如何产生适合于相关语音任务的表示,例如重音分类。Sautidb-Naija已发表于Zenodo,以便在灵活的创造性的公共许可证下使用。
translated by 谷歌翻译
近年来,自我监督的学习在涉及计算机视觉和自然语言处理的应用中取得了重大成功。借口任务的类型对性能提升至关重要。一个常见的借口任务是图像对图像之间的相似性和异化的量度。在这种情况下,构成负对的两个图像与人类明显不同。然而,在昆虫学中,物种几乎无法区分,因此难以区分。在这项研究中,我们探讨了暹罗神经网络的表现,通过学习使用对比损失来推动大黄蜂物种对的嵌入,这是不同的,并将相似的嵌入物汇集在一起。我们的实验结果显示了零射击实例的61%F1分数,表现出对与培训集交叉口的类别的提高11%的性能。
translated by 谷歌翻译